期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于动态加权函数的集成分类算法
王乐, 韩萌, 李小娟, 张妮, 程浩东
《计算机应用》唯一官方网站    2022, 42 (4): 1137-1147.   DOI: 10.11772/j.issn.1001-9081.2021071259
摘要401)   HTML12)    PDF (838KB)(99)    收藏

针对数据流集成分类如何使分类器适应不断变化的数据流,调整基分类器的权重选择合适的分类器集合的问题,提出了一种基于动态加权函数的集成分类算法。首先,提出了一种加权函数调节基分类器的权重,使用不断更新的数据块训练分类器;然后,使用一个新的权重函数对候选分类器进行一个合理的选择;最后,在基分类器中应用决策树的增量性质,实现对数据流的分类。通过大量实验发现,基于动态加权函数的集成分类算法的性能不受块的大小影响,与AUE2算法相比,叶子数平均减少了681.3、节点数平均减少了1 192.8,树的深度平均减少了4.42,同时相对地提高了准确率,降低了消耗时间。实验结果表明该算法在对数据流进行分类时不但可以保证准确率还可以节省大量的内存空间和时间。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于正负效用划分的高效用模式挖掘方法综述
张妮, 韩萌, 王乐, 李小娟, 程浩东
《计算机应用》唯一官方网站    2022, 42 (4): 999-1010.   DOI: 10.11772/j.issn.1001-9081.2021071268
摘要345)   HTML38)    PDF (1254KB)(314)    收藏

高效用模式挖掘(HUPM)是新兴的数据科学研究内容之一,通过考虑事务数据库中项的单位利润和数量,以提取出更有用的信息。传统的HUPM方法假定所有项的效用值均为正,但是在实际应用中,某些数据项的效用值可能为负(如商品因产生亏损而导致利润值为负),含负项的模式挖掘与仅含正项的模式挖掘同样重要。首先,阐述了HUPM的相关概念,并分别给出相应正负效用的实例;然后,以正与负角度划分了HUPM方法,其中带有正效用的模式挖掘方法进一步以动态与静态的数据库新颖角度划分,带有负效用的模式挖掘方法中包括了基于先验、基于树、基于效用列表和基于数组等关键技术,并从不同方面对这些方法进行了讨论和总结;最后,给出了现有HUPM方法的不足和下一步研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于准确率爬坡的动态加权集成分类算法
李小娟, 韩萌, 王乐, 张妮, 程浩东
《计算机应用》唯一官方网站    2022, 42 (1): 123-131.   DOI: 10.11772/j.issn.1001-9081.2021071234
摘要246)   HTML11)    PDF (992KB)(70)    收藏

传统集成分类算法中,一般将集成数目设置为固定值,这可能会导致较低分类准确率。针对这一问题,提出了准确率爬坡集成分类算法(C-ECA)。首先,该算法不再用一些基分类器去替换相同数量的表现最差的基分类器,而是基于准确率对基分类器进行更新,然后确定最佳集成数目。其次,在C-ECA的基础上提出了基于爬坡的动态加权集成分类算法(C-DWECA)。该算法提出了一个加权函数,其在具有不同特征的数据流上训练基分类器时,可以获得基分类器的最佳权值,从而提升集成分类器的性能。最后,为了能更早地检测到概念漂移并提高最终精度,采用了快速霍夫丁漂移检测方法(FHDDM)。实验结果表明C-DWECA的准确率最高可达到97.44%,并且该算法的平均准确率比自适应多样性的在线增强(ADOB)算法提升了40%左右,也优于杠杆装袋(LevBag)、自适应随机森林(ARF)等其他对比算法。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 基于BiLSTM-CNN串行混合模型的文本情感分析
赵宏, 王乐, 王伟杰
计算机应用    2020, 40 (1): 16-22.   DOI: 10.11772/j.issn.1001-9081.2019060968
摘要653)      PDF (1101KB)(686)    收藏
针对现有文本情感分析方法准确率不高、实时性不强以及特征提取不充分的问题,构建了双向长短时记忆神经网络和卷积神经网络(BiLSTM-CNN)的串行混合模型。首先,利用双向循环长短时记忆(BiLSTM)神经网络提取文本的上下文信息;然后,对已提取的上下文特征利用卷积神经网络(CNN)进行局部语义特征提取;最后,使用Softmax得出文本的情感倾向。通过与CNN、长短时记忆神经网络(LSTM)、BiLSTM等单一模型对比,所提出的文本情感分析模型在综合评价指标F1上分别提高了2.02个百分点、1.18个百分点和0.85个百分点;与长短时记忆神经网络和卷积神经网络(LSTM-CNN)、BiLSTM-CNN并行特征融合等混合模型对比,所提出的文本情感分析模型在综合评价指标F1上分别提高了1.86个百分点和0.76个百分点。实验结果表明,基于BiLSTM-CNN的串行混合模型在实际应用中具有较大的价值。
参考文献 | 相关文章 | 多维度评价
5. 基于特征提取偏好与背景色相关性的数据增强算法
余鹰, 王乐为, 张应龙
计算机应用    2019, 39 (11): 3172-3177.   DOI: 10.11772/j.issn.1001-9081.2019051140
摘要358)      PDF (1039KB)(248)    收藏
深度神经网络具有强大的特征自学习能力,可以通过多层逐步提取的方式获取不同层次的粒度特征,但当图片目标本体与背景色具有强相关性时,特征提取会存在"惰性",所提取特征的抽象层次较低,判别性不足。针对此问题,通过实验对深度神经网络特征提取的内在规律进行研究,发现特征提取偏好与图片背景色之间具有相关性,消除该相关性可以帮助深度神经网络忽略背景的干扰,直接学习目标本体的特征,由此提出了数据增强算法,并在自主构建的数据集上进行实验。实验结果表明,所提算法可以降低背景色对目标本体特征提取的干扰,减少过拟合,提高分类效果。
参考文献 | 相关文章 | 多维度评价
6. 基于词法特征的恶意域名快速检测算法
赵宏, 常兆斌, 王乐
计算机应用    2019, 39 (1): 227-231.   DOI: 10.11772/j.issn.1001-9081.2018051118
摘要515)      PDF (863KB)(276)    收藏
针对互联网中恶意域名攻击事件频发,现有域名检测方法实时性不强的问题,提出一种基于词法特征的恶意域名快速检测算法。该算法根据恶意域名的特点,首先将所有待测域名按照长度进行正则化处理后赋予权值;然后利用聚类算法将待测域名划分成多个小组,并利用改进的堆排序算法按照组内权值总和计算各域名小组优先级,根据优先级降序依次计算各域名小组中每一域名与黑名单上域名之间的编辑距离;最后依据编辑距离值快速判定恶意域名。算法运行结果表明,基于词法特征的恶意域名快速检测算法与单一使用域名语义和单一使用域名词法的恶意域名检测算法相比,准确率分别提高1.7%与2.5%,检测速率分别提高13.9%与6.8%,具有更高的准确率和实时性。
参考文献 | 相关文章 | 多维度评价
7. 基于模式增长的不确定数据的频繁模式挖掘算法
王乐, 常艳芬, 王水
计算机应用    2015, 35 (7): 1921-1926.   DOI: 10.11772/j.issn.1001-9081.2015.07.1921
摘要435)      PDF (898KB)(679)    收藏

为提高不确定数据频繁模式(FP)挖掘算法的时空效率,提出了基于最大概率的不确定频繁模式挖掘(UFPM-MP)算法。首先,利用事务项集中的最大概率值预估期望支持数;然后,使用该期望支持数与最小期望支持数阈值进行比较,以确定某一项集是否为候选频繁项集,并对候选项集建立子树以递归挖掘频繁模式。实验中,UFPM-MP算法与AT-Mine算法进行了对比,并在6个典型的数据集上进行实验验证。实验结果表明,UFPM-MP算法的时空效率得到了提高,稀疏数据集上提高约30%,稠密数据集上的效率提高更为明显(约3~4倍)。预估期望支持数的策略有效地减少了子树和头表项的数量,从而提高了算法的时空效率;且最小期望支持数越小,或需要挖掘的频繁模式越多的时候,算法的时间效率提高越多。

参考文献 | 相关文章 | 多维度评价
8. 孕妇个体化定量化营养曲线的绘制算法研究及实现
陈波 王乐 闫娟娟
计算机应用   
摘要1238)      PDF (562KB)(787)    收藏
针对目前临床应用中孕妇营养保健体系难以定量分析的现状,提出一种将个体营养实际需求量、实际摄入量以及营养状况统一起来的营养评价方法,利用数据库技术绘出适合于中国居民的营养成分曲线图,使个体营养定量分析直观化、系统化,并给出相应的营养指导。该算法已用于孕妇营养定量指导系统,临床应用证实,该系统能给予孕妇很好地指导。
相关文章 | 多维度评价
9. 基于场景模型的BGP-4健壮性测试研究
戴经国 王乐春 钟海荣 张春元
计算机应用   
摘要1542)      PDF (599KB)(837)    收藏
提出了一种系统实现协议健壮性测试的新方法。该方法通过深入分析BGP的路由信息处理过程,建立场景模型来描述决策过程和更新过程的应用环境和控制参数,并基于该模型提出了健壮性测试案例生成方法。该方法是通信协议测试和软件测试相结合,具有良好的应用发展前景。路由协议BGP的实际测试应用表明,该方法避免了组合爆炸问题,生成的反向测试集的检错能力是正向测试集的2.3倍。
相关文章 | 多维度评价